作者:金赫中,韩国对外经济政策研究院(KIEP)美洲研究团队副研究委员摘编:金赫中,“美国对华AI半导体出口限制的影响及启示”,韩国对外经济政策研究院编《世界经济焦点(World Economy Focus)》,Vol.5 N.31,2022年9月27日。翻译整理:吕耀龙,韩国汉阳大学国际学大学院博士生;张露文,韩国建国大学经营工学学院博士生。
2022年8月26日,美国开始对中国实施AI半导体出口限制,尤其是对在AI技术开发中利用率较高的高性能显卡英伟达(NVIDIA) A100、H100和AMD MI250实施了出口许可制度。这一政策可能会在短期内影响中国的AI技术开发,但从中长期来看,中国可以通过使用替代品或云服务等方式等避开限制,所以预计不会对中国的AI技术开发造成很大的影响。
美国为了更有效地牵制中国的AI技术开发,有可能追加监管措施,这可能会对韩国的半导体产业造成负面影响。其中可能包括:在软件方面,增加专属许可框架,以及禁止中国使用美国云服务;在硬件方面,可能扩大到对高性能CPU、FPGA及ASIC等实施出口许可制度,也有可能通过与伙伴国的合作制定追加限制。在这种环境下,美国可能同韩国和台湾方面推进合作,并通过禁止出口利用超微工艺和带有高频内存产品的方式来实现,这就可能削弱韩国半导体产业的产品开发动力,同时导致产品需求减少。今后,如果美国要求韩国提供协助,应该诱导调整美国的相关监管规定,以尽量减少对韩国半导体产业的损害。同时,努力确保现存技术差距也具有很重要的意义。如果韩国参与美国对华限制时,不能都包括存储芯片和半导体制造等所有领域,而是将具体品种为限制对象,这就更符合于韩国半导体产业损失最小化的目标。另外,韩国一方面防止高级技术人才流失的同时,另一方面应积极支持工艺精细化和下一代半导体开发等。
AI技术可以帮助机器模仿或优化人类思维,从而做出更有效的判断,但有可能被用于军事目的。AI技术广泛应用于自然语言处理(natural language processing)、自动驾驶(self-driving)、计算机视觉(computer vision)等领域,为使用者提供便利,作为新市场,潜力巨大。AI技术的应用包括加快决策、大数据应用、改进目标选定、减少战争所需人力等,有可能在军事领域被滥用。AI半导体基本上是以寻找想要分析的对象(反应变量)和解释这一对象的众多因素(解释变量)为基础的。鉴于很难预知反应变量与解释变量之间的关系,AI技术开发通常从表示广泛关系的模型出发,经过缩小到最能预测解释变量的最优模型的阶段。如果使用的模型越广泛,捕获反应变量和解释变量之间复杂关系的可能性就越大,数据越多,就越能可靠地识别模型中的参数,从而获得更好的预测能力。另一方面,当使用更广泛的模型和更多的数据时,随着算法搜索范围越来越大,需要的计算量也会随之增加。这样,剧增的计算量问题可以并行化(通过多个工作人员同时执行尽可能多的任务,parallelization)来解决,AI半导体可以理解为专门的计算器。传统的中央处理器为中心的计算过程,其优点是能够执行需求方要求的复杂指令,并且能够以一个核心的速度进行计算,但可利用的核心数量有限。被分类为AI半导体的显卡及其他计算加速器虽然可以执行的任务范围有限,但可以通过多个核心同时处理AI技术所要求的矩阵计算等大量数据任务,因此非常适合AI技术的开发及利用。为了满足AI技术所需的计算量,提高每个核心的计算能力和内存带宽至关重要。基本上,每个核心的计算能力越高,计算速度也越快,因此优化并行计算的显卡和其他计算加速器的核心计算能力是一个重要的挑战。即使每个核心的计算速度较快,如果内存无法将数据准确传递给核心,则计算过程可能会停滞,而且核心越多,需要传递的数据就越多,因此提高内存带宽十分关键。对于此次限制出口的显卡,两个核心组件——图形处理单元(GPU)决定计算能力,动态随机存取存储器(DRAM)决定内存带宽。AI半导体生态系统为了提高计算能力,在硬件方面依赖于微观工艺和设计技术的发展。工艺细化是提高计算性能的关键,因为通过提高晶体管密度可以增强硬件的计算能力。AI半导体的最新工艺正在迅速应用,此次出口限制对象的高性能显卡的制造工艺要求在7纳米(nm)以下,而消费类显卡则大体上使用8纳米以上的工艺。目前,可制造7nm以下工艺的代工厂包括三星电子、美国英特尔、台湾台积电等。正在开发的英伟达(NVIDIA)下一代高性能显卡H100计划利用台积电的4nm工艺。7nm及以下超微工艺中,曝光环节的核心制造装备EUV光刻机由荷兰ASML独家提供,EUV光刻机是使用EUV进行曝光所必须的,日本JSR和TOK等企业是典型的供应商。内存方面,高带宽内存(HBM)技术被广泛应用于AI半导体生产。在相关技术方面,三星电子、SK海力士、美国AMD和美光领先;在制造方面,三星电子、SK海力士、美光相互竞争,是通过3D设计提高性能的典型事例。最新规格的HBM3是SK海力士首次采用并大量生产的产品,将安装在英伟达的H100上。另一方面,对于消费级显卡则使用GDDR系统的内存,AI技术开发和普通消费级显卡工作所要求的内存带宽存在差异,因此AI半导体的差别化技术应用将持续下去。为支持工艺精细化,通过半导体设计革新引领半导体性能提升的尝试持续不断。以三星电子的PIM(内存处理)为例,英伟达的Grace
Hopper超级半导体,哈瓦那的Gaudi半导体开发等正在进行中。显卡在内的AI半导体与传统CPU的控制方式不同,所以作为后盾的独立软件生态系统也很重要。显卡的命令范围有限,需要单独的框架来灵活地在缓存和DRAM之间进行通信。计算机统一设备体系结构(CUDA)由英伟达独家授权发行,仅支持英伟达的设备,但由于其性能和编程优势,许多AI开发工具库都使用了它。OpenCL(Open Computing Language)是开放源代码的,由AMD、英特尔等半导体企业和AI研究财团共同开发,具有可广泛用于CPU、显卡和FPGA等的优点,但与CUDA相比,AI开发库的成熟度不足。在AI技术开发的初期阶段,需要营造能够灵活试验多个模型的环境,因此对有助于开发的上述框架的依赖度较高。2022年8月以前的出口限制主要集中在对半导体工艺阶段的核心产品的限制上,对AI半导体的限制不够完善。美国的出口限制大致可以分为对产品和用户的限制。美国工业与安全局(BIS)通过商业控制清单(CCL)对特定国家集团实施出口限制,列出对本国安全至关重要的“新兴和基础技术”相关产品。·对用户的监管是通过BIS的实体清单进行管理的,从而可以对CCL中未包含的产品实施出口管制。美国对半导体及生产材料、设计软件和制造设备实施全方位限制,但对AI半导体成品的监管存在模糊的一面。在半导体成品方面,2022年8月之前,对开发AI技术所必需的显卡的限制不足,虽然对FPGA有限制,但对ASIC的限制存在模糊的一面。尽管如此,英特尔、AMD和英伟达有意向中国出口升级Tianhe-2等超级计算机的CPU和显卡,美国商务部曾通过实体清单予以禁止。2022年8月26日,美国以“可能被用于开发对国家安全构成威胁的技术”为由,对中国(包括香港)和俄罗斯实施了英伟达和AMD高性能显卡的出口许可制度。根据英伟达向美国证券交易所提交的公示资料,美国政府以英伟达数据中心用显卡A100或H100类似的最高性能功能(peak
performance capability)和输入输出性能为基线,制定了限制出口这两个项目中任何一个性能优越的显卡的方针。其中,最高性能功能基于是GPU可以执行的32位计算或64位计算的最大计算数(TFLOPS)。虽然没有具体说明,但输入/输出性能(chip-to-chip I/O performance)可以解释为GPU和内存芯片之间的通信性能,预计将以前面提到的AI模型学习的瓶颈点——内存带宽为基准。V100是英伟达现有的顶级显卡之一,未包括在此次出口限制中,根据美国政府对V100的出口管制下限,我们推测V100的计算性能为15TFLOPS(32位),内存带宽为1TB/s。美国证券交易委员会公告资料显示,英伟达预计此次限制将导致对华出口减少4亿美元左右,限制当日英伟达股价较前一日收盘价下跌10.3%。根据9月1日英伟达向美国证券交易委员会提交的动向报告(8-K current report),美国政府在2023年9月1日之前暂时允许通过香港分公司接收和运输A100和H100订单,但此后可能会提出出口许可申请。另外,AMD对中国的数据中心显卡出口微乎其微,预计出口限制不会对利润造成太大的影响。
中国外交部发言人汪文斌2022年9月1日在记者会上表示,“一直以来,美国政府以国家安全为由来扩张权力,不断打压发展中国家发展”, “美国将重大技术垄断化的图谋不会成功”。虽然此次限制规定可能会增加人工智能技术开发所需的时间,但由于不是对所有出口中国的显卡进行限制,因此可以通过替代品进行研究开发等,这一措施很难对中国的人工智能研究产生重大影响。由于短期内可利用显卡受到限制,因此在使用其他替代品的过程中,开发AI技术所需的时间可能会增加。但是在AI技术开发过程中,会有多种显卡被广泛使用,因此替代品使用不会带来编程上的巨大修改。技术开发过程通常是为了节约成本,在制作原型之前依靠低性能显卡,在最终阶段技术得到一定程度的验证后,使用高性能显卡,FPGA或ASIC等AI半导体来完成开发。根据显卡之间的内存大小或核心数差异,算法上可能会有微调,但这些因素很难对该研究产生很大影响。此外,中国国内高性能显卡主要的云服务提供商,除了出口限制产品之外,还有提供其他替代品的服务。除了A100(出口限制项目)外,中国主要云服务商还提供从AMD和英伟达购买替代品的服务。而且,通过在中国以外的服务器上使用云服务,中国国内的AI研究不会受到太大影响。在与AI研究高度相关的超级计算领域,美国对中国的影响力也有限。以2022年6月为基准,中国三大超级计算机神威太湖之光、天合-2A、高等计算系统(Advanced Computing System)全部排除显卡,只使用CPU形态的半导体,包括中国国内制造的半导体组成系统。2012年6月,中国超级计算机性能排名前两位的天合-1A和Nebulae均使用美国CPU,使用英伟达M2050显卡,对美国的依赖度很高。中国持续在超级计算领域实现国产化,以应对美国通过Entity
List实施的制裁。中国壁仞科技公司发布了与此次出口限制对象显卡类似的产品开发。壁仞科技(Biren Technology)是一家新兴的中国企业,由风险企业家张文和曾在英伟达、AMD和三星电子担任显卡设计师的林杰旭创办。该企业表示,与此次出口限制对象NVIDIA的A100相比,BR100的显卡在执行多种机器学习算法时的性能是NVIDIA的2倍以上。无论是对内存带宽还是理论上最高性能的功能进行比较,都可以确定其优于或接近于此次出口限制对象显卡。即使短期内不能将壁仞科技的显卡用于AI技术开发,也可以像之前的超级计算机国产化事例一样,逐渐替代美国产显卡的需求。考虑到韩国的三星电子和SK海力士在存储芯片产业中占据很大比重,此次限制将对韩国的产业产生负面影响。此次出口限制对象的显卡都使用高带宽内存,如前所述,为了解决GPU和内存之间的瓶颈现象,依赖高性能内存的现象今后也将持续下去。如果此次出口限制导致美国对中国的高性能显卡出口减少,生产HBM2e规格内存的三星电子、SK海力士、美光的销售额也会受到打击。另外,如果今后扩大上述政策,作为高性能存储芯片主要需求方的显卡企业的销售渠道将不稳定,因此高性能存储芯片开发动力也将减弱。高性能显卡大多依赖7nm以下的超微工艺,因此具备相应工艺能力的台积电和三星电子代工部门也会受到负面影响。-此次出口限制中的显卡或其替代品GPU大部分由台积电制造。目前。英伟达正在开发的H100也计划利用TSMC的4nm工程。三星电子Foundry似乎不生产此次出口限制对象的显卡,但从具备生产AI半导体所必须的超微工艺能力来看,今后可能会受到影响。
如前所述,此次出口限制本身很难对中国的AI技术应用产生有意义的影响,预计美国将采取进一步措施。本报告将探讨美国可以独自利用的追加制裁手段,并考虑对此采取政策性应对措施。鉴于目前在软件领域牵制中国AI技术运用的制裁不足,可以弥补这一手段(附加措施1-2),与现有政策一脉相承的硬件方面的手段。
另外,在AI半导体产业内,韩国和台湾的半导体业界正在紧密合作,因此有必要研究利用美国伙伴国的手段(附加措施5-7)。今后,美国可能采取的追加措施就如下。(1) 限制中国使用英伟达的CUDA框架
利用英伟达显卡的核心框架是广泛用于AI学习相关模型的CUDA,如果CUDA在中国的使用受到限制,短期内AI技术开发可能会停滞。部分可以用OpenCL等框架替代,但依赖CUDA的AI库在短期内难以替代。考虑到云计算企业使用的显卡大部分都是英伟达产品,可以预想中国国内对其的依赖度也会很高,而依赖于CUDA的AI模型则不可避免地要全面重新开发。在这种情况下,中国对AI研究开发所需的NVIDIA所有显卡的需求将会减少,因此担心会对NVIDIA造成巨大打击等副作用。追加措施将英伟达(NVIDIA)的显卡分为普通消费者和专业用户两种,然后全面限制专业用户的显卡出口,并限制普通消费者使用CUDA。将消费类显卡安装到数据中心违反英伟达的政策。英伟达正在采取措施让专业人士避免使用消费级显卡,这与婴为爱的业务方向相一致。虽然受到制裁,但在不失去巨大的消费级显卡市场的情况下,有可能全面阻止在中国进行AI研究的显卡使用。(2) 禁止在中国境内使用美国数据中心的显卡和ASIC服务美国的出口限制可以通过使用数据中心的显卡和ASIC来规避。如果中国禁止访问美国数据中心提供的显卡和ASIC,使用基于规模经济的服务的企业研究人员将受到直接打击。但这些措施可能存在技术上的困难,而且是侵犯美国数据中心商誉的行为,因此可能会引发争议。如果要利用多个显卡或配置高性能计算设备,必须利用多个高性能服务器的CPU,而不是一般消费级服务器。除了现有的实体列表外,还可对以项目为中心的高性能CPU进行管理。考虑到中国国内没有实现高性能CPU的完全国产化,这种出口限制政策可能会引起英特尔或AMD的反对,因为他们可能会失去潜在的销售渠道。(4) 限制对其他计算加速器(FPGA、ASIC)对特定AI技术的验证结束后,为了提高该技术的使用效率,可以依赖FPGA或ASIC等计算加速器,从这一点来看,对其他计算加速器的限制也可以成为牵制AI技术开发的有效战略。截至2022年9月,对ASIC的制裁标准尚不明确,完善CCL并引入新的出口限制是美国面临的课题。由于评价定制型半导体性能的标准根据不同的目的会有所不同,因此制定统一的限制标准并非易事。具体而言,可以要求AI半导体的核心构部分——高频存储器的主制造企业——三星电子和SK海力士“禁止对华出口最新规格存储器”。高带宽内存的使用是AI半导体制造的重要部分,中国要想独立设计显卡,与三星电子、SK海力士、美光的合作是必不可少的。如果美国利用伙伴国的措施,可以在对本国的损害最小化的同时有效牵制中国的AI技术开发,因此会优先考虑这样的措施,但这会对韩国的相关产品销售及开发造成很大的阻碍。这些措施今后可能会改变为对装载ECC功能的存储器等的出口限制。(2) 限制台积电和三星电子生产对华出口的AI半导体
目前,中国很难自行利用超微工艺生产半导体,所以如果禁止中国利用三星电子和台积电的超微工艺进行委托生产,中国的AI半导体生产能力可能会大幅下降。美国方面要求台积电、三星停止向华为供货。这些措施会对主要代工企业的工艺开发目标的实现造成很大影响,并通过减少销售额的途径直接对台积电和三星电子造成损害。(3) 通过转移生产基地,将核心技术纳入到美国生态系统美国通过《CHIPS for America Act》和《FABS Act》等已经展开了通过半导体税制优惠吸引本国半导体生产基地的政策,生产AI半导体所需的超微工艺及高频内存生产设施如果转移到美国国内,可以更有效地牵制中国人工智能技术开发。从之前的超级计算机事例中可以看出,中国已经对CPU进行了相当程度的国产化,类似地,为了应对美国对AI半导体的制裁,预计会推进包括显卡在内的AI半导体的国产化。(2) 中国有望推进人工智能半导体制造的核心要素——高性能存储器和生产工艺的国产化。如果三星电子、SK海力士、美光等受到美国政府制裁的影响,中国将无法获得高性能存储器供应,从而在AI半导体生产上面临困难,为了打破这一局面,中国可以尝试自主设计高性能存储器。在半导体制造方面,预计也将尝试引进超微工艺技术,但EUV光刻机等受到出口限制,短时间内很难克服。(3) 为利用AI半导体,将在中国发展独立的AI研究开发用框架。中国已经在神威、太湖之光等超级计算机上使用国产操作系统等,在软件方面也取得了国产化的进展,独立的高性能显卡设计已经走上了一定的轨道,因此预计将投入很多人力进行支持这一方案的框架开发。中国AI技术能力逐渐提升以中国具有优势的计算机视觉(computer vision)或模式识别(pattern recognition)领域为中心扩大影响力,从长远来看,也有可能形成中国制造框架的依附。(4) 中国将通过引进高级人才或成立合资公司等形式,努力缩小技术差距。确保在半导体设计或存储器制造领域的高级人才是缩小技术差距的核心要素,从这一点来看,根据之前的壁仞科技事例,可以预测中国将持续在超微工程或高性能存储器领域引进人才。同时,中国为了应对美国的技术制裁,也有可能通过与半导体生产技术的领军者成立合资公司等方式,缩小技术差距。作为美国对华高性能CPU制裁的反作用,中国的中科曙光(Sugon)曾与AMD合作生产用于服务器的CPU Hygon Dhyana(海光禅定)。同样,类似的企业间合作关系也有可能扩散到整个AI半导体产业。(1) 以内存规格等为对象的限制会大大降低相关产品的需求,所以应该摒弃。美国此次的出口限制措施和之前看到的单独追加的预测措施都可能对本国企业造成巨大损失,还不足以从根本上切断中国的AI半导体开发和应用。仅凭单独的制裁很难对中国的AI技术开发产生一定程度以上的影响,因此美国今后可以通过FAB4(CHIP4)等协商机制,开始讨论对用于军事目的的产品进行制裁,在此过程中可以诱导韩国和台湾的共同参与。高带宽内存实际上受到高性能显卡全部产品需求的影响,因此如果美国要求对中国进行全方位的限制,很难被完全接受。为了最大限度地减少对AI半导体产业的负面影响,即使利用伙伴国进行的制裁,也需要确保不太超出此次出口限制对象的品种范围。随着技术发展的潮流,处理器的计算性能发展和内存带宽将持续成为决定AI技术发展效率的两大支柱。韩国在半导体制造方面,有必要巩固三星电子在存储器领域的地位,以及三星电子和SK海力士在高性能AI半导体生产中的地位。目前,中国努力实现上述核心技术的国产化,美国试图将生产基地编入本国生态系统的情况下,韩国需要努力维持半导体产业的竞争力。如前所述,中国在半导体设计和制造的国产化过程中,正在大力探索引进高级人才。韩国为维持用于AI技术开发的半导体生产技术差距,应防止相关人才的流失。另外,今后韩国企业与中国设立半导体合资公司等形式,可能会对未来韩美之间的合作埋下隐患,也有可能在将来会招致其他国家企业的追击,因此有必要调整对外合作水平。韩国正在通过K-半导体战略(2021年),实施扩大7nm以下EUV尖端代工生产能力的支援政策,需要持续支援这些核心技术的开发。(3) 应加强对突破工艺精细化限制的新型AI半导体开发的支援。
韩国政府在科学技术信息通信部和产业通商资源部的主导下开发了神经处理单元APIM系统软件,今后5年内将投资1.02万亿韩元,并为确保超标准的技术能力的制定支援对策。虽然开发新型半导体的风险很大,但作为行业领先者,如果能成为业界标准,那么在随后的平台竞争中就能占据优势,因此需要更加积极的支持和支援。- END -